Mostrar que conectando los buses al Big Data el servicio puede ser monitoreado, segundo a segundo, y mejorado para el bien de la gente y del municipio
Para lograr el objetivo:
Se han simulado casi 700 mil datos sobre el recorrido de los buses
La simulación trata de acercarse a la realidad lo más posible
Alcances de la simulación
Se eligió 1 de las 6 rutas
Se eligió una dirección de la ruta
Se tomaron los tiempos 5 veces en horas que se suponen normales (sin tráfico, protestas, etc)
Se introdujeron alteraciones predecibles a la normalidad
Paradas con más gente que otras
Tramos mas lentos que otros: tráfico vehicular
Marchas y bloqueos en el centro de la ciudad
Horas que afectan los tiempos en los tramos (v.g. medio día vs. media noche)
Se supuso que los buses al pasar por las paradas generan automáticamente los datos
Se computaron los intervalos oficiales de partida y con todo lo anterior se simularon casi 700 mil datos en R
Muestra de la simulación en R
Resultados de la simulación
Estadísticas: Sugiero que imagine que así se podrá monitorear el servicio
- 97% de los viajes tardan entre 52 y 60 minutos desde la primera hasta la última parada - Sin embargo, a veces los buses tardan hasta 175 minutos (casi 3 horas) - Veamos qué días y a qué horas se producen los mayores atrasos - Los 4 picos muestran atrasos por protestas sociales - ¿En qué tramos están las protestas? - Los tramos entre las paradas 1 y 4 son los menos regulares. Los mayores atrasos se generan allí - Veamos en detalle estos tramos, sabiendo que son los que generan los atrasos
Para ver el atraso por tramos y horas se utilizaron “boxplots”. Ver la siguiente explicación
Veamos el mismo gráfico pero sin valores extremos
Hasta aquí:
Las protestas sociales en 4 días del mes produjeron los atrasos mas considerables
Las protestas ocurren en el centro y perjudican a las paradas 1, 2 y 3
Las protestas afectan a los buses que transitan entre las 11am y 5pm
¿Los atrasos se dan únicamente por protestas sociales?
Veamos los tiempos de recorrido excluyendo los días de las protestas
En días “calmados” el tiempo más rápido del Puma Katari es de 51 minutos pero el mas lento de 64 minutos
¿Qué tramos podrían corregirse y a qué horas para que los buses sean mas predecibles?
Los tramos 1-2 y 3-4 son los que tienen mayor variación Antes cerciorémonos que los otros tramos no tienen variaciones extremas
La mayoría de los buses en estos tramos tienen variaciones de tiempo de menos de un minuto. Los problemas mas serios no están en estos tramos
Se sabe que los tramos 1-2 y 3-4 son los que generan los mayores atrasos. Pero, ¿a qué horas?
Los mayores problemas están a horas 7,8,9,13,14,19 y 20Las distorsiones de tiempo están claramente a las 7 y 8 de la mañana
¿Es posible que los atrasos se originan por la tardanza de los pasajeron al subir al bus en horas y paradas pico?
Los pasajeron no contribuyen significativamente al atraso. En promedio un bus necesita 18.01 segundos para subir a los pasajeros
Resumen hasta aquí
Problema 1: protestas sociales
77 días
Es la suma del tiempo perdido de los pasajeros en los 4 días de protestas
Problema 2: tramos y horas pico
155 días
Es la suma del tiempo perdido de los pasajeros excluyendo los 4 días de protestas en un mes
El desafío es pasar del modelo azul al rojo: tiempo total del recorrido
Se sabe sobre qué tramos y horas se debe actuar. Después, los datos nos dirán si las reformas son efectivas o no
Propuesta
No se necesita mucho
Los datos de la simulación pesan 14 megabytes o 2% de un DVD
Los datos para todas las rutas por año pesarían 19 gigabytes o 4 DVD`s